In this paper, we propose a robust election simulation model and independently developed election anomaly detection algorithm that demonstrates the simulation's utility. The simulation generates artificial elections with similar properties and trends as elections from the real world, while giving users control and knowledge over all the important components of the elections. We generate a clean election results dataset without fraud as well as datasets with varying degrees of fraud. We then measure how well the algorithm is able to successfully detect the level of fraud present. The algorithm determines how similar actual election results are as compared to the predicted results from polling and a regression model of other regions that have similar demographics. We use k-means to partition electoral regions into clusters such that demographic homogeneity is maximized among clusters. We then use a novelty detection algorithm implemented as a one-class Support Vector Machine where the clean data is provided in the form of polling predictions and regression predictions. The regression predictions are built from the actual data in such a way that the data supervises itself. We show both the effectiveness of the simulation technique and the machine learning model in its success in identifying fraudulent regions.
translated by 谷歌翻译
最近,疾病控制和预防中心(CDC)与其他联邦机构合作,以鉴定冠心病疾病2019年(Covid-19)发病率(热点)的县,并为当地卫生部门提供支持,以限制疾病的传播。了解热点事件的时空动态非常重视支持政策决策并防止大规模爆发。本文提出了一种时空贝叶斯框架,用于早期检测美国Covid-19热点(在县级)。我们假设观察到的病例和热点都依赖于一类潜随机变量,其编码Covid-19传输的底层时空动态。这种潜在的变量遵循零均值高斯过程,其协方差由非静止内核功能指定。我们内核功能的最突出的特征是引入深度神经网络,以增强模型的代表性,同时仍然享有内核的可解释性。我们得出了一种稀疏的模型,并使用变分的学习策略适合模型,以规避大数据集的计算诡计。与其他基线方法相比,我们的模型展示了更好的解释性和优越的热点检测性能。
translated by 谷歌翻译
现实世界中人类流动性数据集的最新扩散促进了轨迹预测,需求预测,旅行时间估计和异常检测方面的地理空间和运输研究。但是,这些数据集还可以更广泛地对复杂的人类流动系统进行描述性分析。我们正式将生命分析模式定义为在线无监督异常检测的自然,可解释的扩展,我们不仅监视数据流的异常数据流,而且随着时间的推移会明确提取正常模式。为了学习生活的模式,我们在需要时适应了(GWR)的(GWR)从计算生物学和神经机构的研究到地理空间分析的新领域。与自组织图(SOM)有关的生物学启发的神经网络,在GPS流上迭代时会逐渐构建一组“记忆”或原型流量模式。然后,它将每个新观察结果与其先前的经验进行比较,从而诱导了在线,无监督的聚类和数据的异常检测。我们从Porto出租车数据集中挖掘出利益的模式,包括主要的公共假期和新发现的运输异常,例如节日和音乐会,据我们所知,这些疾病以前尚未在先前的工作中得到认可或报道。我们预计,在许多领域,包括智能城市,自动驾驶汽车以及城市规划和管理等许多领域,可以逐步学习正常和异常的道路运输行为的能力将是有用的。
translated by 谷歌翻译
需要了解和预测车辆的行为是运输领域中的公共和私人目标的基础,包括城市规划和管理,乘车共享服务以及智能运输系统。个人的喜好和预期目的地在整天,周和年中各不相同:例如,酒吧在晚上最受欢迎,海滩在夏天最受欢迎。尽管有这一原则,我们注意到葡萄牙波尔图的流行基准数据集的最新研究充其量只能通过纳入时间信息来提高预测性能的边际改善。我们提出了一种基于HyperNetworks的方法,该方法是一种元学习的变体(“学习学习”),其中神经网络学会根据输入来改变自己的权重。在我们的情况下,负责目标预测的权重有所不同,尤其是输入轨迹的时间。时间条件的权重显着改善了模型相对于消融研究和可比较的工作的误差,我们证实了我们的假设,即时间知识应改善对车辆预期目的地的预测。
translated by 谷歌翻译
肿瘤浸润淋巴细胞(TIL)的定量已被证明是乳腺癌患者预后的独立预测因子。通常,病理学家对含有tils的基质区域的比例进行估计,以获得TILS评分。乳腺癌(Tiger)挑战中肿瘤浸润淋巴细胞旨在评估计算机生成的TILS评分的预后意义,以预测作为COX比例风险模型的一部分的存活率。在这一挑战中,作为Tiager团队,我们已经开发了一种算法,以将肿瘤与基质与基质进行第一部分,然后将肿瘤散装区域用于TILS检测。最后,我们使用这些输出来生成每种情况的TILS分数。在初步测试中,我们的方法达到了肿瘤 - 细胞瘤的加权骰子评分为0.791,而淋巴细胞检测的FROC得分为0.572。为了预测生存,我们的模型达到了0.719的C索引。这些结果在老虎挑战的初步测试排行榜中获得了第一名。
translated by 谷歌翻译
头部和颈部鳞状细胞癌(HNSCC)的病因涉及多种致癌物,例如酒精,烟草和人乳头瘤病毒(HPV)。由于HPV感染会影响HNSCC患者的预后,治疗和存活,因此确定这些肿瘤的HPV状态很重要。在本文中,我们提出了一个新颖的三胞胎级损耗函数和HPV状态预测的多个实例学习管道。这仅使用两个HNSCC同类群体上的常规H&E染色WSI,在HPV检测中实现了新的最新性能。此外,还进行了全面的肿瘤微环境分析,从基因组,免​​疫学和细胞角度来看,HPV +/- HNSCC之间的独特模式。鉴定了与巨噬细胞和结缔细胞(例如成纤维细胞)(例如,成纤维细胞)(例如,成纤维细胞)与T细胞不同亚型(例如T细胞,CD8+ T细胞)的正类型的正相关性,这与临床发现一致。还针对HPV感染状态鉴定了独特的基因表达谱,并且与现有发现一致。
translated by 谷歌翻译
口腔上皮发育不良(OED)是对口腔的病变给出的恶性肿瘤性组织病理学诊断。预测OED等级或情况是否将转型给恶性肿瘤对于早期检测和适当的治疗至关重要。 OED通常从上皮的下三分之一开始,然后以等级的严重程度向上逐步开始,因此我们提出了分割上皮层,除了单独的细胞核之外,还可以使研究人员能够评估级别/恶性预测的重要层种形态特征。我们呈现悬停网+,深度学习框架,以同时分段(和分类)核和(内部)在H&E染色的载玻片中的核和(内)上皮层。所提出的架构由编码器分支和四个解码器分支组成,用于同时对上皮层的核和语义分割的同时分段。我们表明,拟议的模型在两个任务中实现了最先进的(SOTA)性能,而与每个任务的先前的SOTA方法相比,没有额外的成本。据我们所知,我们的是同时核实例分割和语义组织分割的第一种方法,具有用于其他类似同时任务的计算病理和对恶性预测的研究。
translated by 谷歌翻译